Rank in Wordlist | Frequency | Word |
---|---|---|
7483 | 406 | নারায়নগঞ্জ,পশ্চিম,ডিপিডিসিজেলা |
10888 | 248 | ইউ,পি |
11523 | 230 | এস,এস,সি |
12693 | 201 | ৭,৮,১০ |
13756 | 180 | ১০,০০০ |
14300 | 170 | বলেন,‘ |
18488 | 117 | জে,এস,সি |
18784 | 114 | এম,পি,ও |
20640 | 100 | ৫,০০০ |
21525 | 94 | ১,০০০ |
Rank in Wordlist | Frequency | Word |
---|---|---|
19309 | 110 | ০৭(সাত |
19537 | 108 | ১(এক |
19956 | 104 | কমিশনার(ভূমি |
20772 | 99 | ০১(এক |
20773 | 99 | ০৩(তিন |
20775 | 99 | ৩(তিন |
20920 | 98 | ২(দুই |
21073 | 97 | ৭(সাত |
23658 | 82 | ১০(দশ |
25570 | 73 | ০২(দুই |
Rank in Wordlist | Frequency | Word |
---|---|---|
4947 | 681 | শ্রেণীভিত্তিক)বর্তমান |
15885 | 146 | ক্ষেত্রে)। |
20965 | 97 | কিলোবাইট)জনাব |
22711 | 87 | হবে)। |
23734 | 81 | টাকা)। |
26429 | 69 | না)। |
26440 | 69 | পর্যন্ত)। |
27045 | 67 | ৩৫)। |
27901 | 64 | হয়)। |
28025 | 63 | জন্য)। |
Rank in Wordlist | Frequency | Word |
---|---|---|
1192 | 3522 | ১০০% |
4888 | 690 | 100% |
5689 | 575 | ৫০% |
6550 | 482 | ১০% |
7018 | 442 | ৫% |
8722 | 336 | ০% |
9923 | 282 | ৮০% |
10254 | 269 | ৭৫% |
10287 | 268 | ৯০% |
10342 | 266 | ২০% |
Rank in Wordlist | Frequency | Word |
---|---|---|
107053 | 8 | U&Me |
127753 | 6 | AT&T |
128227 | 6 | T&T |
151404 | 5 | ডাচ&-বাংলা |
182098 | 4 | প্রযু&&ক্ত |
196958 | 3 | GPS&COMPASS |
251631 | 2 | DPD&T |
252289 | 2 | H&S… |
253753 | 2 | R&D |
254716 | 2 | UH&FWC |
Rank in Wordlist | Frequency | Word |
---|---|---|
12987 | 194 | $২৫ |
13758 | 179 | $১০- |
24284 | 78 | 200$-400$ |
29512 | 58 | $০ |
29866 | 57 | $0.10 |
31691 | 52 | 10$ |
34429 | 46 | 100$ |
38363 | 39 | $10 |
38385 | 39 | 500$ |
42111 | 35 | ১$ |
Rank in Wordlist | Frequency | Word |
---|---|---|
11367 | 234 | উপসি'ত |
11573 | 229 | দু'টি |
15485 | 151 | Author's |
17003 | 132 | People's |
17213 | 131 | স্বাস'্য |
17611 | 126 | তা'আলা |
18501 | 117 | দু'জন |
20034 | 104 | ব্যবস'া |
22651 | 87 | বিএনপি'র |
30018 | 57 | দু'বছর |
Rank in Wordlist | Frequency | Word |
---|---|---|
363104 | 2 | ১%+১% |
366802 | 2 | ৬০%+৪০% |
Rank in Wordlist | Frequency | Word |
---|---|---|
3693 | 976 | http://techtweets |
4163 | 842 | শিক্ষক/ |
4424 | 780 | সমাপনী/পাবলিক |
4773 | 711 | ছাত্র/ছাত্রী |
5867 | 552 | কর্মকর্তা/কর্মচারী |
6880 | 453 | ২/৩ |
7088 | 436 | ছাত্র/ছাত্রীদের |
7534 | 402 | ছাত্র/ছাত্রীর |
9093 | 316 | শিক্ষক/শিক্ষিকা |
9437 | 301 | কর্মকর্তা/কর্মচারীদের |
In the last subsection of this type we look for words containing other special characters: , ( ) % & $
" ' + * = / _
Depending on the language some of these characters may be allowed within words, other will not. If words with forbidden characters do not have very low frequency there might be a problem in preprocessing.
Words containing %:
select w_id-100,freq, word from words where w_id>100 and word like "%\%%" limit 10;
3.12.1 Words with Hyphens
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots